經典機器學習
歡迎來到人工智能概念(COMP5511)的第 6 課。本課程旨在連接理論基礎與實際的演算法實作。雖然現代人工智能通常強調深度學習,經典機器學習 仍然是數據分析的基石。這些演算法具有高度的可解釋性 和 計算效率,因此它們是結構化數據和行業標準分析的首選。
1. 監督式學習
此範例涉及在一個標記數據集上訓練模型,演算法會學習輸入特徵與特定目標輸出之間的關係。這使模型能夠準確地預測結果,用於新的、未見過的數據。
- 決策樹: 將數據分割成分支以達成分類或數值決策的模型。
- 支援向量機 (SVMs): 尋找最佳超平面以最大化不同數據類別之間邊界的演算法。
2. 非監督式學習
這些演算法分析未標記數據,以在沒有預先指導的情況下發現隱藏的模式、結構或分組。主要技術包括:
- K-均值分群: 根據特徵相似性將數據點分組為 K 個不同的群集。
- 主成分分析 (PCA): 一種降維技術,用於簡化複雜數據同時保留其基本變異性。
可解釋性 vs. 複雜性
經典機器學習的一個顯著優勢是其透明度。與「黑盒子」深度學習模型不同,決策樹等演算法允許人類追蹤預測背後的確切邏輯,這對於醫學或金融等高風險領域至關重要。
Scikit-learn 實作流程